Workshop Information Retrieval 2008 6 . - 8 . October 2008 , University of Würzburg , Germany
نویسندگان
چکیده
Plagiaterkennung in Programmen (Quellcode) funktioniert analog zu der in Texten: gegeben ist der Quellcode eines Programms dq sowie eine Kollektion D von Programmquellen. Die Retrieval-Aufgabe besteht darin, in dq alle Codeabschnitte zu identifizieren, die aus Dokumenten in D übernommen wurden. Im vorliegenden Papier werden Parallelen und Unterschiede zwischen der Plagiaterkennung in Texten und der in Computerprogrammen aufgezeigt, ein neues Maß zum Ähnlichkeitsvergleich kurzer Code-Abschnitte vorgestellt und erstmalig Fingerprinting als Technologie für effizientes Retrieval aus großen Codekollektionen (|D| ≈ 80.000) demonstriert. In den von uns durchgeführten Experimenten werden kurze Codeabschnitte ausD, die eine hohe Ähnlichkeit zu Abschnitten aus dq aufweisen, mit einer Precision von 0.45 bei einem Recall von 0.51 in konstanter Zeit gefunden.
منابع مشابه
147th ENMC international workshop: guideline on processing and evaluation of sural nerve biopsies, 15-17 December 2006, Naarden, The Netherlands.
a Department of Neurology, University of Würzburg, Würzburg, Josef-Schneider-Str. 11, 97080 Würzburg, Germany b Department of Neuropathology, Institute of Neurology, London, United Kingdom c Department of Neurology, Mayo Clinic and Mayo Foundation, Rochester, United States d Department of Neurology, CHRU Dupuytren, Limoges, France e Department of Neurology, University of Tromsö, Tromsö, Norway ...
متن کاملInfluence of reconstruction on the surface state of Au(110)
Andreas Nuber,1,* Mitsuharu Higashiguchi,2 Frank Forster,1 Peter Blaha,3 Kenya Shimada,4 and Friedrich Reinert1,5 1Experimentelle Physik II, Universität Würzburg, Am Hubland, D-97074 Würzburg, Germany 2Graduate School of Science, Hiroshima University, Higashi-Hiroshima 739-8526, Japan 3Institute of Materials Chemistry, Vienna University of Technology, Getreidemarkt 9/165, A-1060 Vienna, Austria...
متن کاملSummary of the 15th Discovery Challenge Recommending Given Names
1 University of Kassel, Knowledge Discovery and Data Engineering Group, Wilhelmshöher Allee 73, 34121 Kassel, Germany {mitzlaff, doerfel, mueller}@cs.uni-kassel.de 2 University of Würzburg, Data Mining and Information Retrieval Group, Am Hubland, 97074 Würzburg, Germany [email protected] 3 L3S Research Center, Appelstraße 4, 30167 Hannover, Germany {hotho, juergen.mueller, jaesc...
متن کاملCartesian Quasi-Random Sampling for Multiple Contrasts and Dynamic Imaging
P. Ehses, N. Seiberlich, M. Blaimer, F. Breuer, W. R. Bauer, and P. M. Jakob Dept. of Experimental Physics 5, Universität Würzburg, Würzburg, Germany, Department of Radiology, Case Western Reserve University and University Hospitals of Cleveland, Cleveland, Ohio, United States, Research Center Magnetic Resonance Bavaria (MRB), Würzburg, Germany, Dept. of Internal Medicine I, Universität Würzbur...
متن کاملPrecise predictions for LHC using a GOLEM
X iv :0 80 7. 06 05 v2 [ he pph ] 1 5 A ug 2 00 8 Precise predictions for LHC using a GOLEM T. Binoth, A. Guffanti, J.-Ph. Guillet, G. Heinrich, S. Karg, N. Kauer , P. Mertsch, T. Reiter, J. Reuter, and G. Sanguinetti School of Physics, The University of Edinburgh, Edinburgh EH9 3JZ, UK Department of Physics, University of Freiburg, Hermann-Herder-Str. 3a, D-79104 Freiburg, Germany LAPTH, 9, Ch...
متن کامل